Καλώς ορίσατε στο dotNETZone.gr - Σύνδεση | Εγγραφή | Βοήθεια
σε

 

Αρχική σελίδα Ιστολόγια Συζητήσεις Εκθέσεις Φωτογραφιών Αρχειοθήκες

Microsoft server crash nearly causes 800-plane pile-up

Îåêßíçóå áðü ôï ìÝëïò patrick. Τελευταία δημοσίευση από το μέλος Παναγιώτης Καναβός στις 02-11-2004, 10:24. Υπάρχουν 4 απαντήσεις.
Ταξινόμηση Δημοσιεύσεων: Προηγούμενο Επόμενο
  •  24-09-2004, 15:05 188

    Microsoft server crash nearly causes 800-plane pile-up

  •  25-09-2004, 11:16 191 σε απάντηση της 188

    Re: Microsoft server crash nearly causes 800-plane pile-up

    Καταπληκτικό!

    Αλλά δεν είναι ξεκάθαρο τι ακριβώς φταίει. Γιατί data overload κάθε 50 μέρες;

    Andreas Tsouchlaris
    My Blog / dotNetZone.gr / autoexec.gr
  •  25-09-2004, 14:11 192 σε απάντηση της 191

    Re: Microsoft server crash nearly causes 800-plane pile-up

    Και εγώ έψαχνα για μία πιο καλή "περιγραφή" του θέματος, και βρήκα αυτό:

     Paul Thurrott - WinInfo Daily Update wrote:
    A startling report about a Windows flaw causing a massive 800-plane pileup in southern California has made the rounds on the Web, with Linux and Macintosh backers pointing their fingers and nodding knowingly. The story would be fascinating if it were true. But two separate human errors, not a Windows flaw, caused the 800-plane pileup. And a "software glitch" that required technicians to essentially reboot a non-Windows communications system was the only technical "flaw" that contributed to the pileup. Airport officials have known about that glitch for some time and have been working to fix it. So what about the Windows flaw that (ahem) caused all the problems? It turns out the flaw wasn't a flaw at all. Instead, the Win2K Advanced Server systems that the air traffic control system uses were improperly integrated into the preexisting system, and although technicians were supposed to manually reboot the machines every 30 days, a technician forgot to do so. The machines were configured to automatically reboot every 49.7 days; in this case, they did so at a pretty inopportune time. In short, the flaw was in the configuration, not in Windows itself. Not that Windows is perfect, mind you, but spare me. Enough problems with Windows already exist; we don't need to make up stuff like this.

    Patrick
  •  25-09-2004, 21:13 193 σε απάντηση της 188

    Re: Microsoft server crash nearly causes 800-plane pile-up

    Κάτι μου θύμισε το πράγμα και το έψαξα στο Knowledge Base. Θυμάται κανείς ότι τα Windows 95 είχαν αυτό το πρόβλημα? Βρήκα λοιπόν το παρακάτω άρθρο The Rpcss.exe process consumes 60 percent of CPU time and performance is affected, με ημερομηνία 7/7/2004. Όπως λέει και το άρθρο όμως, αυτό δεν συμβαίνει πάντα.
    Απ' ότι φαίνεται το πρόβλημα οφείλεται στο GetTickCount το οποίο επιστρέφει το χρόνο λειτουργίας του μηχανήματος σε ms. Η τιμή που επιστρέφει είναι ένα DWORD το οποίο χωράει Big Smile 49.7 ημέρες και μετά guess what κάνει overflow και αρχίζει από το 0. Αν ψάξετε στο Knowledge Base θα βρείτε αρκετά σημεία όπου στο παρελθόν είχαν παρουσιαστεί προβλήματα εξαιτίας αυτού του περιορισμού. Αυτά προφανώς διορθώθηκαν σιγά-σιγά αλλά όπως φαίνεται κάτι ξεφεύγει που και πού.
    Μετά έριξα και ένα Google και βρήκα αυτό το περσινό Google: Windows 2000 site goes over two years without reboot. Θυμήθηκα και ότι κάποιοι server στην δουλειά έχουν να κάνουν reboot μήνες. Και εκείνο το αρχαίο NT Server στη μονάδα που ήμουν φαντάρος και δεν του είχα κάνει reboot για 9 μήνες (όχι ότι είχε και κανένα σοβαρό φορτίο).
    Λοιπόν, πολύ θα ήθελα να ήξερα τί έκαναν σε αυτό το αεροδρόμιο. Επίσης, θα ήθελα να ξέρω γιατί θα πρέπει το reboot να γίνεται με το χέρι. Δεν μπορούσαν να κάνουν ένα task που θα κάνει το reboot αυτόματα? Αν το μηχάνημα ήταν σε cluster δεν θα έπρεπε να τους επηρεάσει. Αντί να τα ρίχνουν στον τεχνικό που δεν εκπαιδεύτηκε επαρκώς θα έπρεπε να είχαν προβλέψει την πιθανότητα κάποιος να ξεχάσει να εκτελέσει μια χειροκίνητη διαδικασία.


    Παναγιώτης Καναβός, Freelancer
    Twitter: http://www.twitter.com/pkanavos
  •  02-11-2004, 10:24 395 σε απάντηση της 188

    Angry [:@] Re: Microsoft server crash nearly causes 800-plane pile-up

    Τελικά ήταν όλα παραμύθι! Tongue Tied Ένα απίστευτο bug του κατασκευαστή του συστήματος (Harris) που κάποιοι απίστευτοι δημοσιογράφου στους LA Times απέδωσαν σε bug των Windows χωρίς να έχουν ιδέα τί έγινε, και τους οποίους αντέγραψε το Techworld χωρίς να ενδιαφερθεί καν τί λέγανε!
      Το IEEE Spectrum περιγράφει τί ακριβώς έγινε στο παρακάτω άρθρο http://www.spectrum.ieee.org/WEBONLY/resource/nov04/1104nair.html. Όπως φαίνεται, στο σύστημα χρησιμοποιούν ένα countdown time με ανάλυση millisecond για να κάνουν queries σε άλλο σύστημα, αλλά ξεχνάνε να κάνουν reset τον timer μετά από κάθε query! Surprise Έτσι μετά από 49.7 ημέρες ο timer πιάνει 0 και ΜΠΟΥΜ!
      Η εταιρεία το ήξερε ότι είχε πρόβλημα το σύστημα. Πως το αντιμετώπισε? Βάζοντας κάποιον να κάνει reboot κάθε 30 μέρες!Tongue Tied

    ΑΠΙΣΤΕΥΤΟ! Μα πως είναι δυνατόν μια εταιρεία που φτιάχνει τέτοια συστήματα να κάνει τέτοια γκάφα? Αλλά και οι δημοσιογράφοι? Που έγραψαν τέτοια είδηση χωρίς να έχουν ιδέα τί έγινε?

    Με ανησυχεί όμως και κάτι άλλο. Αν η Harris, που βγάζει ασυρμάτους και τηλεπικοινωνιακά συστήματα ακόμα και για το στρατό, έχει ξεπέσει τόσο, τότε την έχουμε άσχημα. Είπαμε, ανάπτυξη σε internet time αλλά όχι κι έτσι! [:^)]
    Παναγιώτης Καναβός, Freelancer
    Twitter: http://www.twitter.com/pkanavos
Προβολή Τροφοδοσίας RSS με μορφή XML
Με χρήση του Community Server (Commercial Edition), από την Telligent Systems